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) Verfahren zur Spracherkennung durch einen Rechner 

Das Verfahren ermoglicht eine beschleunigte Klassifika- 
tion innarhalb eines Spracherkennungssystams. Dazu wird 
phonetisehas Wissen in Form von Distanzan zu Lauteinhet- 
tan banutzt, urn iterativ die Gute dar Klassifikation zu 
verbassem. Fur einen vorgebbaren Kontaxtgrad wird eine 
minimale Dtstanz von Merkmalsvektor zu vorhandenen Laut- 
einheiten berechnet und in einem nichstan Schritt innarhalb 
eines vorgebbaren Bereichs um das gefundane Minimum 
Abstande berechnet zu Lauteinharten mit hoharam Kontaxt- 
grad. SchlieBtich werden die klassifizierten Lauteinharten zu 
Sprache zusa mmengesetzt. 
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Beschreibung 

Die Erfindung betrifftein Verfahren zur Spracherkennung durch einen Rechner. 

Spracherkennung beginnt bei der Erfassung eines Sprachsignals in Form einer Abtastung mid Dighafisierung. 
5 Es folgt eine Merkmalsextraktion (V rverarbehung) und cine Klassifikation (aucfa: Distanzberedmung) de$ 
vorverarbeheten Sprachsignak. Im letzten Schritt der Spracherkennung (Stxche) werden WortmodeDe zugeord- 
net, es ergibt sicb eine erkannte W rtsequenz (si he[l]). 

Die Distanzberechnung steDt den rechenmtensrvsten Scbritt bei der Spracherkennung dar. Je nach Anwen- 
dungsfall kann dabei der Antefl der bendtigten Redienleistung fur die Distanzberechnung bis zu fiber 80% des 
io gesamten Berrc hmmg saufwands des Sprachcrkenners betr ag e n , 

In [2] ist ein Verfahren zur Distanzberechnung genannt, das gegenuber der Erfindung den NachteO aufweist, 
daB statistisdie Ouster entsprechend statistischer Vertethmgen angeordnet sindl somh die Gute der Spracher- 
kennung direkt von der Anzahl der Cluster abhangt und der Berechnungsaufwand hoch ist 
A us [3] sind Hidden-Markov-ModeDe (HMMs) zur Laut- und Wortmodelliening bekannt. Weiterhin sind in [4] 
is kontinuierfiche mehitfimensionate, metst multivariate, Verte3ungen (z. R. Laplace- oder GauB-Verte3ungen) fur 
die ModeQienmg der Merkmale implemennert 

Die Aufgabe der Erfmdung besteht darin, dn Verfahren zur Distanzberechnung anzugeben, das eine schneDe 
Klassifikation eines Merkmalsvektors (nut vorgebbarer Genauigkeh) ermdgiicht. 
Diese Aufgabe wird gemafi den Merkmalen des Patentanspruchs 1 geidst 
20 Zu diskreten Abtastzettpunkten wird ein Spntrhsignal nut einer vorgebbaren Taktrate abgetastet und digitaB- 
sierL Zu jedem Abtastzeitpunkt wird das Sprachsignal in einen Merkmalsvektor nut vorgebbarer Dimension 
abgebildet Zur Durchfuhrung der Distanzberechnung werden Abst&nde des jeweOigen Merkmalsvektors zu 
vorgebbaren Mustervektoren bestimmL 

Die Mustervektoren stellen unterscheidbare Lauteinhehen der Sprache dar. Jede Lauteinheh verfugt fiber 
25 einen Kontextgrad, der angibt, wie weh der Kontext der Lauteinheit reicht, 

Zunachst wird zu ersten Mustervektoren, die Lauteinhehen mh einem vorgebbaren ersten Kontextgrad 
darstellen, jeweils ein Abstand zu dem Merkmalsvektor berechneL Aus all den so berechneten ersten Abstanden 
wird ein erstes Minimum der ersten Abstande ausgewahh. 
Urn eine genauere Klassifikation des Merkmalsvektors vornehmen zu konnen, werden in einem n&chsten 
30 Schritt zweite Mustervektoren, die Lauteinhehen mit einem zwehen Kontextgrad darstellen, wobet der zwehe 
Kontextgrad groBer als der erste Kontextgrad ist, innerhalb eines vorgebbaren Bereichs urn die durch das erste 
Minimum klassifizierte Lauteinheh zur Berechnung von zwehen Abstanden herangezogen. Ein zweites Mini* 
mum der zwehen Abstande klassifiziert eine Lauteinheh mh einem gegenfiber der zu dem ersten Minimum 
gehdrenden Lauteinheh hoherem Kontextgrad. 
35 Reicht die Gute der durchgeffihrten Klassifikation des Merkmalsvektors aus, so kann das Verfahren beendet 
werden, indem Sprache aus klassifizierten Lauteinhehen zusammengesetzt und somh erkannt wiiti 

Soil eine genauere Klassifikation erfolgen, so wird nochmals der Kontextgrad der zu untersuchenden Lautein- 
hehen erbdht, und somh in einem vorgebbaren Beretch um die zuletzt das zuletzt klassifizierte Minimum 
Abstande zu dem Merkmalsvektor berechnet. Diese Iteration kann beiiebig oft wiederboh werden, um ein 
40 immer besseres Ergebnis zu erhalten. Allerdings genugt eine Klassifikadon mh hohem Kontextgrad nicht mehr 
der Fordenmg nach einer Echtzehbedingung, da die Erhdhung des Kontextgrads den Aufwand fur die Berech- 
nung der Klassifikation typischerweise exponentiefl ansteigen laBt 

Eine Weiterbikiung des erfindungsgemaBen Verfahrens besteht darin, bei Verwendung von Lauteinhehen mh 
hoherem Kontextgrad den nachsthoheren Kontextgrad auszuwahlen. 
45 Die Erfindung kann dahingehend wehergebQdet werden, daB zu Beginn des Verfahrens Lauteinhehen mh 
dem Kontextgrad "1" verwendet werden. 

Weherhin konnen als solche Lauteinhehen zu Beginn des erfindungsgemaBen Verfahrens Phoneme oder 
Monophone einer Sprache verwendet werden. 
Eine andere WeherbQdung der Erfmdung besteht darin, Diphone oder Triphone oder aus mehreren Phone- 
so men zusammengesetzte Laute als Lauteinheiten zu verwenden. 

In den Figuren sind Ausfuhnmgsbeispiele der Erfindung dargesteOt, die im weiteren n&her eriautert werden. 
Eszeigen 

Fig. 1 ein Blockdiagramm, das Schritte des erfindungsgemaBen Verfahrens enthah, 
Fig. 2 eine Skizze, die die Erfindung im zweidimensionalen Merkmalsraum veranschaulicht. 
55 In Fig. 1 werden Schritte des erfindungsgemaBen Verfahrens fur die Berechnung der Distanz einer Untereuv 
heit dargestelh. 

Vektoren werden nachfolgend als kleine fettgedruckte Zeicfaen oder mh einem Pfeil, Matrizen als groBe 
f ettgedruckte Zeichen dargestellt. 

Gesprochene Sprache wird abgetastet und in digitalisierter Form einem Rechner zugangfich gemacht. In 
60 Schritt la, der Vorverarbehung, wird demzufolge in regelmaBigen Abstand (z. B. aOe 10ms) ein Merkmalsvektor 
x, der das aktueOe Sprachsignal reprasentiert, der Dimension D» (typische Werte fQr die Dimension: 20*64) 
ermhteh. 

Worter werden aus Einhehen modeOiert, die eine Abfolge von Znstanden in einem Hidden-Markov-ModeD 
(siehe ausfQhruche Beschreibung in [3]) darstellen, Solche Einhehen sind zumeist Phoneme, es konnen aber audi 
65 Halbsilben, Sflben oder andere Einhehen verwendet werden. Eine Gesamtanzahl von Untereinhehen Nq, die die 
kleinsten sich unterscheidenden Einheiten von Sprache darstellen, schwankt je nach System und gewQnschter 
Appfikation (z. B. Einzelworterkennung, k ntinuierhche Sprache, Sprecherunabhangigkeh) zwischen weniger 
als 100 und mehreren 1000 Untereinhehen No. 
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Bei der Distanzberechnung (siehe Fig. 1, Scfaritte lb bis If) geht es darum, fur alle Untereinhehen No 
akustiscbe Distanzen gemaB einer verwendeten modellierenden Verteflung zu berechnen. Fur jede Unteremheh 
u werden N*<u) Verteflungen zur Modefliening benutzt, wobei sich N*(u) fur jede Untereinheit u tmterscheiden 
kann Typische Werte fur Nv(u) liegen zwischen 1 and 100. Bei Verwendung von GanB-VerteOungen werden 
diese dargestelh als 



a = fife. Cj) 



(1) 



wobei fLj der Dx-dimensionale M melpunktsvektor und C die Dx-dimensionale Kovarianzmatrix der mh j indi- 
zierten GauB-Verteflung gj bezeichnen. 

Die Gesamtverteflung fur eine Untereinheh a (Summe der GauB- Verteflungen) wird dargestelh dureb go- Es 
handett sich dabei um die mh q gewtchtete Summe der einzemen VerteDungen: 



9u = 



Nj(u) 



(2) 
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Es ist Qblicb, von diagonal en Kovarianzmatrizen der GauBverteihmgen auszugehen. o\j bezeicfanet dann die 
i-te Komponente der Varianz der Verteflung j. Die Wahrschemlichkeh dafur, daB eine besummte Unteremheh u 
auf getreten ist, wenn der beobachtete Merkmalsvektor x vorliegt, berechnet sich zu: zs 



Nv(u) c 

PuW = k x Z -5— 



_i x * (xj ~ ^±f 



i=l 



i=l 



(3) 



wobei k erne vorgebbare implementieningsabh9ngige Konstante ist 

One verwendete Nahenmg geht davon aus, daB die Wahrscheinlichkeit einer Untereinheit n von der Wahr- 
scheinlichkeit der "besten" (= wahrscbeinltchsten) Verteilung dominiert wird. Dies bedeutet, daB i&- Gleichung 
(3) die aufiere Summe durch einen max-Operator ersetzt werden kann. Es ist aber immer noch die Berechnung 
der Wahrscheinlichkeit en aller Verteflungen notwendig, denn erst dann kann der max-Operator ausgewertet 
werden: 



35 



k x 



i=l 



V(j € {l,...,N v (u)}) 



(4) . 



Um die Berechnung des komplexen Terms in Gleichung (4) zu umgehen, wird Gleichung (4) logarithmiert, man 
spricht dann von Distanzen ansteUe von Wahrscheinlichkehen und bezeichnet diese Distanzen mit dd(x). Nach 
Umformen ergibt sich folgende Gleichung zur Berechnung der Distanz der akustischen Untereinheit u bei 
Voriiegen des betrachteten Merkmalsvektors x: 



50 
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60 
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(5), 

V(j e {i,...,K,(u)}) 



wobei Kij and K^j von der Realisiening abhangige vorgebbafe Konstanten darsteQen, die einmal im Voraus 
berechnet werden konnen. 

Ahnliche Beredmungsschemata ergeben sich auch bei Verwendung anderer Verteflungen, z. B. der Laplace- 
Verteilung, und schranken das erfmdungsgemaBe Verfahren nicht auf die ausgefuhrte Verteflungsvariante em. 
15 Gleichung (5) wird fur alle Untereinhehen u ausgewertet. Die Gesamtzahl aller Verteilungen tm System fur 
alle Untereinhehen u sei N T and berecbnet stcb za 



20 N v = X N vfr) (6) - 

Das bedeutet daB alle 10ms (aDe 10ms wird ein Merkmalsvektor ersteOt) Nv-mal ein D^dimensionaler 
25 Abstand berecbnet wird, wobei N T bei Systemen typischerweise im Bereich 1000—500 000 KegL Diese Berech- 
nung kann heatzutage von dnem handelsubfichen Rechner (PQ Workstation, Signalprozessor) nicht unter 
Bnhaltimg der Ecbtzehbedingung durcbgefuhrt werden. 

Das erfindungsgemaBe Verfahren zetchnet sicb dadurcb aus, daB phonetiscbes Wissen zur Bestimmung einer 
Untennenge von Reprasentanten herangezogen wird. Es findet ein direktes Clustering von Untereinheiten statt. 
30 Die Erfindung verwendet als ein primares Kriterium zur Ennittlung einer geeigneten Untennenge zu berech- 
nender Distanzen das Wissen urn den pbonetiscfaen Kontext der modellierten (Sprach-)Segmente bzw. Unterein- 
hetteiL 

_ Zur Erlauterung des erfmdungsgema&en Verfahrens wird von der Verwendung von Pfaonemen als Basis-Laut- 
einheiten fur die Spracherkennung ausgegangen. Das Verfahren ist jedoch auf fur andere Lautemheiten als 
55 Phoneme reafisierbar. 

Ein typisches Spracberkennungssystem enthalt ca. 40—60 Basis-Lauteinhehen. Bei solchen Basis-Lauteinhei- 
ten handeh es sich urn kontextunabhangige Lauteinhehen. Urn Sprache genauer kla s s ifizier en zu konnen, 
werden Basis-Lauteinhehen in Abhangigkeh der vorangehenden und nachfolgendea Basis-Lauteinheiten gebQ- 
det 

40 Heutzutage werden Diphone, d. h. zwei Phoneme bestimmen die Untereinheh (ein Nachbarphonem wird zur 
KontextbDdung herangezogenX Triphone, d. h. drei Phoneme bestimmen die Untereinheh und Quinphone, d. h. 
funf Phoneme bestimmen die Untereinheh, verwendet. 
Kontext-abhangige Lauteinhehen werden wie fblgt notiert: 

45 U(i-l,...,i-l|,i+l,...i+r) (7) 

wobei i einen Zentrallaut markiert, bei dem 1 Laute im vorangehenden (— linken) Kontext und r Laute im 
nachfolgenden («=rechten) Kontext zur Bestimmung der Untereinheh berucksichtigt werden. Es liegt ^mnarh 
ein(l+r+l)-Lautvor. 

so Durch diese hier beschriebene Modellierung kann sich die Anzahl der Lautemheiten mit hdherem Kontext- 
grad, in Abhangigkeh der jeweiligen Anwendung auf mehrere 1000 erhohen, da die Anzahl der verschiedenen 
theoretisch mdglichen Lauteinheiten mh der Potenz der berucksichtigten Kontextlange w&chst 

Neben den kontext-abhangigen Lauteinhehen werden zusatzKch kontext-unabhangige Lauteinheiten (— 
Basis-Lauteinheiten) implementiert Diese Basis-Lauteinheiten dienen bei "fastlook-ahead*-Methoden zur 

55 schnellen Vorauswahl von Hypothesen in der Suche nach einer Klassifikation eines Merkmalsvektors oder 
werden zur Modellierung von Wdrtern herangezogen, wenn wahrend einer Trainingsphase des Spracherken- 
uungssystems zu wenige Ergebnisse voriagen, urn modeHierende Verteflungen nach Gleichung (2) fQr die 
detaillierten Untereinhehen (im weheren Kontext) zu bestimmen. 
Fur alle Lauteinheiten (Untereinheiten u) wird ein Kontextgrad Gk bestimmt, der angibt, wie weit der 

60 Kontext der jeweiligen Lauteinheit reicht Fur Basis-Lauteinheiten (kontextunabhangige Untereinhehen) gflt 
Gk* 1, fur Diphone gflt Gk«=2, fOr Triphone gilt Gk=3, usw. Fur kontextabhangige Lauteinheiten gflt gemflB 
Gleichung (7) fur den Kontextgrad 

Gic-l+r+1 (8). 

65 

In der Erfindung wird zur Entscheidung, ob <fie Distanz einer Lauteinheh genauer (in einem hoheren Detaillie- 
rungsgrad) berecbnet werden soli, die Distanz der gleichen Lauteinheit im kleineren Kontextgrad (= abstrakte- 
ren Kontext) herangezogen. Das bedeutet, dafi zur Entscheidung, ob die Distanz fur die Lauteinheh 
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Lfi-l,...,i-l|,i+l f ...i^3 

explizh berechnet wird, die Distanz fQr einen abstrakteren Laut 

L*bs(i— l|,i+l,..-i+ra) 5 

herangezogen wind, w bei gflt b<l r 2 <r. Der Vortefl liegt darin, daB fur aDe Lj( ... % bei denen h<l r 2 <rgflt, 
die Distanz der gletchen abstrakten Untereinheh L*t» zur Entschekiung verwendet werden kann. Demznf lge 
wird bei der Wahl der abstrakten Lauteinheh bis auf die Basis-Lauteinhehen zuruckgegriffen, fur die gflt 1— r— 0. 

Sodann wird die optimale Distanz dopt aus alien Distanzen der abstrakten Lauteinhehen berecfanet (siehe to 
Fig. 1, Schritt ley. 



dop t - minj{dabs,i} v(± e {l, . . . , N u#a bs}) < 9 > . 
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wobei N^ubs eine Anzahl der abstrakten Lauteinhehen bezeichnet und Nibs die Anzahl der Verteflungen, die die 
Nutbs abstrakten Lauteinhehen modelliert, bezeichnet. 

Ini Schritt le werden fur Lauteinheiten mh hdherem Kontextgrad die Distanzen explizh berechnet, wobei die 
Bedingung 20 

(Us < dopt + thr (10) 

vorechreibt, daB innerbalb eines vorgebbaren Bereichs (gekennzeichnet durch den vorgebbaren Wert thr) am 
das nach Gleichung (9) erreebnet Minimum dopt abstrakte Lauteinheiten doai» zu einer detaillierteren Klassifi- 2s 
zienmg des Merkmalsvektors herangezogen werden (Scbritt Id). 

Fur den vorgebbaren Wert thr kann gehem thr « const, <Lh.es wird eine Konstante durch Vorberechnung 
bestimmt, oder der Wert thr wird imptizh abhangig von dem augenblicklichen Merkznalsvektor x ausgewahh 



thr«KtfarXdopt (HX 

wobei Ktfar ein vorgebbarer Wert ist 

Fur alle Lauteinhehen, deren Distanz der abstrakten Lauteinheit nach Gleichung (11) nicht innerhalb des 
durch den Wert thr vorgebbaren Bereichs liegt, d h. deren Distanz zu grofi ist, wird gesetzt: 35 

d(L<i-U.-.,i-lM+l- = d(Ui«) (12). 

Somh wird die Distanz der abstrakten Untereinheh gewahlt, wodurch die explizhe Berechnung der Distanz 
eingespartwird. 40 

Die Anzahl der explizh zu berechnenden VerteQungen wird mh Nt bezeichnet wobei Nt^Nv gilt. Werden 
nun abstrakte Lauteinhehen zur Entscheidungsfindung nach Gleichung (10) ausgewahh, die gieichzehig Tell des 
Spracherkennungssystems sind, wie bspw. die Basis-Lauteinhehen, sind die Verteflungen der abstrakten Lautein- 
hehen Nabs eine Teflmenge der modellierenden Verteflungen 
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Nabs E N V < 13 > 



Somh gflt: so 
Ng* « + N t < N V (UX 

Auf diese Weise ist immer sichergestelh, daB nie mehr Verteflungen berechnet werden mussen, als das 
eigentliche System beinhaltet, da die zur Entscheidung herangezogenen Lauteinheiten bzw. Verteflungen Tefl S5 
des Systems sind. 

GemaB obiger Beschreibung wird also innerhalb des durch den Wert thr vorgegebenen Bereichs wiederum 
ein Minimum der Abstande dopt ermhteh (Schritt If) und, wenn die Gute der Klassifikation ausreicht (Schritt Id), 
das Verfahren beendet, indem Lauteinhehen zusammengesetzt werden (Schritt Ig) und somh Sprache erkannt 
' wird. Ist hingegen die Gute der Klassifikation noch nicht ausrachend, so wird zu Schritt le gesprungen und das 60 

Verfahren iteriert 

In Fig. 2 wird beispielhaft (fie Klassifikation tm zweidimensionalen Merkmalsraum (xl, x2) veranschaulicht. In 
Fig. 2a sind ein Merkmalsvektor MV, und drei Lauteinheiten LEI, LE2 und LE3 mh demselben Kontextgrad 
dargestellt Zu jeder Lauteinheit LEI, LE2 und LE3 wird jewefls eine Distanz dl, d2 und d3 berechnet. Das 
Minimum aus den Distanzen, hier der Abstand dl, wird gemaB Gleichung (9) ausgewahh. 65 

In Fig. 2b wird urn das ausgewahlte Minimum ein vorgebbarer Bereich gemaB Gleichung (10) gekennzeichnet 
durch dl + thr, bestimmt. Im Beispiel Gegen auBer der Lauteinheh LEI noch wehere Lauteinheiten LE1-1, LEI -2, 
LEI -3 und LEI -4 mh gegenGber Lauteinheh LEI hdherem Kontextgrad innerhalb dieses vorg bbaren Bereichs. 
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Fur jede cfieser LautenJfeen LE1-1, LE1-2, LEI -3 and LEI -4 wird ^^Os die Distanz berecfanet Aus den 
resultierenden Distanzen dl-1, dl-2, dl-3 und dl-4 wird das Minimum berecfanet (wteder nacfa CH cichung (9)X 
Das Verfahren kann f ortgesetzt heriert werden, indem urn das ausgewahhe Minimum dl-4 wieder ein vorgebba- 
rer Beretch bestimmt wird und innerfaalb dieses Bereichs Distanzen zu Lauteinheiten mit hdherem Kontextgrad 
5 als die Lauteinheh LE1-4 berecfanet werden. 
Literatur: 

[1] G. Ruske: Automatiscfae Spracfaerkennung: Methoden der Klasafikation und Merkmalsexti aktion. Olden- 
bourg, Muncben 1988, ISBN 3-486-20877-Z, S.1-1G. 
[2] Enrico Bocchieri: Vector Quantization for the Efficient Computation f Continu us Density likelihoods, 
to Proa IEEE Internationa] Conference f Acoustics, Speech and Signal Processing (ICASSPjl SL 11-692 bis 11-695. 
[3] I* R. Rabinen A Tutorial on Hidden Markov Models ans Selected Applications in Speech Recognition, 
Proa IEEE, Feb. 1989, S. 257 -286. 

[4] L R. Rabiner, B.-H. Juang, & E. Levinson, ML M. Sondfai: Recognition of Isolated Digits Using Hidden 
Markov Models with Continuous Mixture Densities, AT&T Technical Journal, VoL64, Noufi, July-August 1985, S. 
!5 1211-1234. 

Patentansprficfae 

1. Verfahren zur Spracherkennung durcfa einen Recfaner, 
20 a) bei dem ein Sprachsignal mh einer vorgebbaren Taktrate digftalisiert wird, 

b) bei dem das dighalisierte Sprachsignal zu je einem Abtastzehpunkt, der durcfa die Taktrate festge- 
legt ist in einen Merkmalsvektor abgebfldet wird, 

c) bei dem erste Abstinde des Merkmalsvektors zu ersten Mustervektoren ermitteh werden, wobei (fie 
Mustervektoren jeweils one kleinste unterscfaeidbare Lauteinheit mh einem vorgebbaren Kontext- 

2s grad, der angibt, wie weh der Kontext einer Lauteinheit rdcht, darsteDen, 

d) bei d em ein erstes Minimum der ersten Abstande ausgewihlt wird, 

e) bei dem urn das erste Minimum ein vorgebbarer Bereich ausgewahh wird und in diesem Berekfa 
zwehe Abstande des Merkmalsvektors von zwehen Mustervektoren, die jeweils Lauteinheiten mh 
gegenuber den kleinsten unterscfaeidbaren Lauteinheit en hdherem Kontextgrad darsteDen, bestimmt 

30 werden, 

f) bei dem ein zwehes Minimum der zwehen Abstande ausgewahh wird, 

g) bei dem der Merkmalsvektor durcfa die fiber das zwehe Minimum erreichbare Lauteinheh klassifi- 
ziert wird oder, falls eine genauere KlassifDcation erforderiicfa ist, das zwehe Minimum als das erste 
Minimum angenommen und mit Scfaritt e) f ortgefahren wird, 

35 h) bei dem aus zusammengesetzten klassifizierten Lauteinheiten Sprache erkannt wird. 

Z Verfahren nach Anspruch 1, bei dem im Scfaritt e) fur die zwehen Mustervektoren der nachsthdhere 
Kontextgrad gegenuber den ersten Mustervektoren ausgewahh wird. 

3. Verfahren nach Anspruch 1 oder % bei dem die ersten Mustervektoren kontrytimabhangige Einhehen mh 
dem Kontextgrad 1 darsteDen. 
40 4. Verfahren nach einem der Anspruche 1 bis 3, bei dem als Mustervektoren Phoneme einer Sprache 

verwendet werden. 

5. Verfahren nach einem der Anspruche 1 bis 3, bei dem als Mustervektoren Triphone einer Spracfae 
verwendet werden. 

& Verfahren nach einem der Anspruche 1 bis 3, bei dem als Mustervektoren Quinphone einer Sprache 
verwendet werden. 
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